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摘要 : [目的 /意义 ] 核 心 专利 的 发 现 是 技术 创新 的 重要 环节 ,对 于 技术 改进 和 专利 战略 布局 意义 重大 。 
[方法 /过 程 ] 首先 界定 核心 专利 的 概念 ,然后 在 对 原始 PageRank 算法 模型 介绍 的 基础 上 ,结合 专利 的 被 引 次 数 
和 专利 的 年 龄 对 原始 的 PageRank 算法 进行 改进 ,提出 PatentRank 算法 (简称 PTR), 并 将 其 应 用 到 OLED 领域 中 


来 识别 核心 专利 。[ 


结果 /结论 ] 研究 发 现 , 相 比 被 引 次 数 ,PTR 不 仅 能 将 该 领域 的 核心 专利 识别 出 来 ,而 且 还 可 


以 识别 出 一 些 重 要 性 的 基础 性 专利 ,为 研究 OLED 相关 技术 提供 追 本 溯源 的 研究 思路 ; 相 比 原始 PageRank 算 


法 ,PTR 具有 更 高 的 值 区 分 度 , 在 局 部 改善 了 PR 的 排名 。 
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2008 年 《国家 知识 产权 战略 纲要 》 中 指出 : 当今 世 
界 、\ 随 着 知识 经 济 和 经 济 全 球 化 深入 发 展 ,知识 产权 日 
着 成 为 国家 发 展 的 战略 性 资源 和 国际 竞争 力 的 核心 要 
素 成 为 建设 创新 型 国家 的 重要 支撑 和 掌握 发 展 主动 
权 葬 关键 。 专 利 作为 知识 产权 的 重要 组 成 部 分 体现 
了 全 个 国家 自主 创新 的 能 力 。 据 世界 知识 产权 组 织 统 
计 @ 此 界 上 90% -95% 的 发 明 都 能 在 专利 文献 中 找 
到 外, 由 此 可 见 , 专 利 尤 其 是 核心 专利 代表 着 行业 内 
最 钨 进 的 技术 ,具有 重要 的 技术 价值 和 市 场 经 济 价值 。 


术 具 有 重大 影响 且 具 有 重要 经 济 价 值 的 专利 ”。 但 是 ， 
就 现在 已 经 建成 的 公开 专利 数据 资源 来 看 ,一 个 专利 
的 经 济 价值 很 难 获 得 精准 的 数据 。 所 以 ,本 文 主要 聚 
焦 在 “对 其 他 专利 具有 重大 影响 ”的 度量 上 , 即 在 当前 
条 件 下 ,首先 识别 出 影响 力 大 的 核心 专利 ,也 就 是 “高 
影响 力 专 利 ”, 并 假定 这 些 核 心 专利 相对 其 他 一 般 专 利 
更 有 可 能 产生 大 的 经 济 价 值 。 

关于 如 何 发 现 核 心 专利 ,国内 外 学 者 都 进行 了 积 
极 探索 ,产生 了 较 多 的 研究 成 果 ,主要 包括 基于 外 部 特 
征 的 核心 专利 识别 .基于 引用 网 络 的 核心 专利 识别 、 采 
用 布 拉 德 福 定 律 “” 的 核心 专利 识别 以 及 利用 专利 分 


对 于 高 科技 型 企业 来 说 ,站 在 专利 整体 布局 的 高 度 上 ， 
核心 专利 的 发 现 可 以 帮助 企业 围 着 核心 专利 进行 外 围 
专利 的 布局 或 者 寻求 密切 合作 伙伴 ,形成 严密 的 专利 
网 ,从 而 巩固 企业 的 核心 苋 争 力 ;而 对 于 新 兴 公 司 , 通 
过 识别 当前 领域 的 核心 专利 并 进行 技术 跟踪 ,可 以 减 
少 无 谓 的 研发 经 费 , 做 到 "心中 有 数 "并 规避 风险 。 然 
而 ,当前 每 年 申请 的 专利 数量 庞大 ,专利 的 质量 也 层次 
不 齐 。 所 以 ,如 何 挖掘 核心 专利 是 摆 在 我 们 面前 或 待 
解决 的 问题 。 

关于 核心 专利 的 概念 ,目前 没有 统一 的 界定 , 埋 志 
华 ” 曾 经 给 出 了 这 样 的 定义 : 某 一 技术 领域 中 处 于 关 
键 地 位 、 对 技术 创新 具有 突出 贡献 ,对 其 他 专利 或 者 技 


析 软 件 “ 进行 的 核心 专利 识别 ,其 中 研究 最 多 的 主 
要 集中 在 两 方面 。 

第 一 是 基于 专利 外 部 特征 的 核心 专利 发 现 人 研究 。 
学 者 们 主要 选取 了 有 代表 性 的 被 引 次 数 .同族 专利 数 
和 专利 权利 要 求 数 等 单一 指标 或 组 合 指标 来 进行 核心 
专利 识别 。F. Narin 等 … 研究 发 现 专利 被 引 次 数 可 
以 作为 评估 企业 核心 技术 的 指标 ,那些 具有 开创 性 的 
专利 的 被 引 次 数 均 高 于 一 般 的 专利 。D. Harhoff 等 
则 指出 同族 专利 数 在 评估 专利 价值 方面 有 很 好 的 应 
用 ,F. Berger 等 "也 发 现 核 心 专利 的 权利 要 求 数 多 于 
普通 专利 的 权利 要 求 数 ,证 明了 权利 要 求 数 也 可 以 用 
来 识别 核心 专利 。 但 是 ,通过 单一 指标 来 识别 核心 专 
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利 具有 很 大 的 片面 性 和 局 限 性 ,因此 后 来 学 者 们 提出 
利用 指标 体系 来 进行 核心 专利 的 识别 。 比 如 霍 汉 
婷 上 选用 了 技术 因素 法律 因素 .经济 因 素 .企业 因素 
和 环境 因素 5 个 因素 构建 了 企业 核心 专利 识别 的 指标 
体系 ; 谢 萍 . 表 润 和 钱 过 ”中 则 是 选取 了 专利 发 明 人 
数 ,专利 权 人 数 、 施 引 专 利 计数 、 同 组 专利 数 和 权利 要 
求 数 等 8 个 指标 来 构建 指标 体系 ; 李 治 东 等 '" 从 专利 
申请 ,授权 和 无 效 三 个 阶段 角度 出 发 ,选取 了 专利 被 引 
次 数 .同族 专利 大 小 .发明 人 数量 和 专利 诉讼 数量 等 指 
标 来 构建 指标 体系 ; 王 天 歌 等 "9 从 技术 指标 、 经 济 指 
标 和 法 律 指标 即 被 引 次 数 ,技术 覆盖 范围 权利 要 求 数 
和 专利 有 效 性 等 指标 出 发 构建 了 指标 体系 ,并 将 其 应 
用 到 生物 医药 领域 中 ,这 些 指标 体系 的 权重 确定 方法 
各 专家 打分 法 .TOPSIS 方法 、 烂 权 层次 分 析 法 和 粗糙 
集 理论 方法 ,但 是 这 些 评价 指标 体系 都 存在 一 些 共性 
问题 , 即 指标 体系 和 体系 权重 的 确定 或 多 或 少 都 有 一 
主观 性 ,容易 引起 争议 。 
亏 第 二 是 基于 专利 引文 的 核心 专利 发 现 的 探讨 。 其 
典型 的 就 是 利用 专利 共 引 来 识别 核心 专利 ,这 种 
河 民 一 般 先 用 表征 专利 外 部 特征 的 被 引 次 数 来 初 第 高 
优 伪 专利 ,然后 再 利用 第 选 后 的 高 价值 专利 建立 共 引 
短 陵 求 得 相似 度 后 进行 因子 分 析 或 者 珍 类 分 析 来 达到 
讶 鹿 核 心 专利 的 目的 。 另 外 ,还 有 学 者 利用 潜在 
引 尘 网 络 关系 对 专利 价值 进行 了 评估 ,例如 汉 岭 等 字 
途 通 计算 专利 间 的 相似 性 来 建立 专利 潜在 引用 关联 并 
计算 直接 和 间接 的 被 引 次 数 来 得 到 专利 价值 。 然 而 ， 
这 些 研 究 基 本 都 是 孤立 地 看 待 每 一 篇 专利 文献 的 引用 
情况 , 忽 咯 了 专利 文献 彼此 之 间 的 相互 作用 ,一 些 作者 
也 试图 来 解决 这 一 问题 。 比 如 ,S. Kim 等 ”对 PageR- 
ank 应 用 到 专利 引文 网 络 之 后 的 结果 与 原始 的 被 引 次 
数 进行 了 比较 分 析 , 发 现 PageRank 所 得 出 的 排名 结果 
与 被 引 次 数 有 很 强 的 相关 性 ; 顾 立 平 鸣 也 将 PageRank 
算法 应 用 到 美国 专利 引文 网 络 中 对 专利 进行 了 排名 ， 
发 现 PageRank 算法 确实 优化 了 原始 的 被 引 次 数 排名 ， 
可 见 ,PageRank 在 改善 原始 的 被 引 次 数 排名 方面 确实 
起 到 了 不 错 的 效果 ,但 是 这 些 学 者 在 将 PageRank 算法 
应 用 到 专利 引文 网 络 时 并 没有 考虑 到 专利 引文 网 络 的 
村 点 ,也 没有 考虑 专利 的 时 效 性 因素 。 

基于 以 上 的 综述 ,可 以 发 现 已 有 的 研究 存在 这 样 
的 问题 :一 是 基于 外 部 特征 的 指标 体系 和 其 权重 的 确 
定 具有 主观 性 ,二 是 运用 引文 网 络 对 专利 进行 研究 时 ， 
有 少数 学 者 运用 了 PageRank 算法 ,考虑 了 专利 之 间 的 
相互 作用 ,但 考虑 专利 的 属性 而 对 PageRank 算法 进 一 


ds 


步 改 进来 识别 核心 专利 仍然 是 一 大 空 日 。 因 此 ,本 文 
从 加 权 引 用 的 角度 ,考虑 专利 引文 的 特点 ,从 引用 的 
“权威 性 ”和 “时 间 性 ”两 方面 对 原始 的 PageRank 算法 
进行 改进 ,提出 一 种 新 的 PatentRank 算法 (简称 PTR ) ， 
继而 将 其 应 用 到 OLED 领域 中 来 识别 核心 技术 ,验证 
PTR 算法 的 科学 性 。 


2 ”基于 改进 PageRank 算法 的 核心 专利 


发 现 模型 构建 
2.1 传统 PageRank 算法 的 基本 原理 
PageRank 算法 是 Google 创始 人 L. Page 和 S. 

Brin ”于 1998 年 构建 早期 的 搜索 系统 原型 时 提出 的 
链接 分 析 算 法 ,用 来 对 互联 网 网 页 进行 排名 。 对 于 某 
个 网 页 A 来 说 ,其 PageRank 值 基于 两 点 假设 :一 是 数 
量 假设 ,在 WWW 网 图 模型 中 ,一 个 网 页 收 到 的 人 链 数 
越 多 ,这 个 网 页 的 质量 就 越 高 ;二 是 质量 假设 ,指向 A 
页 面 的 网 页 的 质量 参差 不 齐 , 质 量 高 的 网 页 会 通过 链 
接 给 其 他 页 面 传递 更 多 的 权重 ,因此 ,指向 页 面 A 的 网 
页 的 质量 越 高 ,A 页 面 的 质量 也 就 越 高 。 把 互联 网 抽 
象 成 一 个 有 向 图 模型 ,假设 网 页 的 个 数 为 n, 该 模型 可 
以 表示 为 G=(V,E) ,其 中 V 表示 顶点 ,E 表示 边 , 顶 
点 的 个 数 为 n, 通 过 图 的 链接 关系 ,可 以 建立 邻接 矩阵 
日, 任 取 h eH, 如 果 存 在 从 网 页 i 到 j 的 链接 , 则 ,= 
1 ,和 否则 为 0 , 即 
se 的 链接 

” lo ,不 存在 i 到 j 的 链接 - 
为 0; = Dn h; ,7 了 =1,2,3,…n, 从 而 节点 j 的 PageRank 
值 如 公式 (1)“ 所 示 : 


PR(j) = pe 


那么 定义 节点 i 的 出 度 


公式 (1) 


即 节点 j 的 PageRank 值 不 仅 受 节点 i 的 PageRank 
值 的 影响 ,还 受 节 点 1 的 出 度 的 影响 ,这 是 最 初 的 模 
型 。 将 邻接 矩阵 H 和 矩阵 中 的 每 一 个 元 素 都 除 以 每 一 
行 和 , 则 得 到 归 一 化 的 邻接 和 矩 阵 A, 即 4; = 

h,/0,, if 0;>0 
if 0,=0 
M ,将 邻接 矩阵 A 转 置 之 后 便 得 矩阵 M ,和 矩阵 M 中 任意 
一 个 元 素 Wi 表示 从 网 页 j 到 i 的 条 件 转移 概率 P(i | 
j) ,这 样 每 个 节点 的 PageRank 值 就 可 以 简写 为 P = 
MP。 很 明显 从 P= MP 这 个 式 子 中 可 以 看 出 这 是 要 求 
矩阵 M 的 特征 向 量 P, 而且 该 特征 向 量 对 应 的 特征 值 
为 1, 这 可 以 用 掺 迭代 法 来 实现 。 然 而 ,由 于 网 络 中 可 
能 会 存在 “悬挂 节点 ”, 即 出 度 为 0 的 节点 ,也 就 是 对 应 


PR(i) 


,这 样 ,定义 图 G 的 转移 概率 矩阵 为 
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转移 概率 矩阵 中 某 一 列 为 0, 导致 该 矩阵 无 法 收敛 ， 
此 ,后 来 就 引入 了 阻尼 因子 入 来 对 公式 (1) 进行 改进 ， 
即 随机 冲浪 者 以 入 的 概率 沿 着 原始 的 链接 关系 进行 游 
走 ,而 以 (1 -入 ) 的 概率 随机 跳 转 到 网 络 中 的 任何 一 个 
网 页 ,这 样 改进 后 的 网 页 PageRank 值 如 公式 (2)” 所 
个: 


. 1-A 
PR(j) = 7 


其 中 入 为 阻尼 因子 ,一 般 取 值 0.85。 将 公式 2 简 
Ce 


+AE’ PR(i)/O, 公式 (2) 


写成 P= 
Po 
中) 各 ,AM。 在 开始 时 ,赋予 给 每 个 网 页 一 个 初始 


+AM) * 忆 ,其 中 下 是 nxn 的 全 1 


的 -PR 值 ， 这 个 初始 的 PR 值 大 小 无 关 紧 要 , 随 着 迭代 
循环 次 数 的 增多 ,每 个 网 页 的 PR 值 最 终 会 收敛 到 一 
全 定 的 值 ， 即 最 后 的 稳 态 分 布 列 向 量 PR ,也 就 是 转 
移 贺 率 矩 阵 B 的 特征 向 量 ,改进 后 的 公式 (2) 是 被 应 
所 最 广 的 。 


ff 


传统 PageRank 算法 在 核心 专利 发 现 的 适用 性 
前 ,有 许多 学 者 利用 公式 (2) 或 者 对 公式 (2) 进 


钱 改 进 并 将 其 应 用 到 期 刊 ,论文 和 作者 引文 网 络 中 
磁 启 价 期 刊 .论文 和 作者 的 影响 力 。 例 如 在 期 刊 影响 


力 评价 方面 , 马 风 利用 原始 的 PageRank 算法 对 图 情 
越 的 期 刊 进行 了 评价 研究 ;文献 评价 方面 , 马 楠 和 官 
建 盛 所 则 将 PageRank 算法 应 用 到 分 子 生物 学 领域 的 
文献 中 来 发 现 重要 的 文献 ， 段 庆 锋 等 ! [5 针对 PageRank 
算法 倾向 于 发 表 时 间 已 久 的 文章 的 缺点 ,将 引文 间隔 
时 间 引入 算法 中 ,对 原始 PageRank 算法 进行 了 改进 ， 
优化 了 评价 的 结果 ;在 作者 影响 力 评价 方面 ,E. Yan 
等 将 改进 的 PageRank 算法 应 用 到 作者 合作 网 络 中 
来 发 现 作者 的 影响 力 , 并 收 到 了 不 错 的 效果 。 可 见 , 随 
着 时 间 的 推移 ,从 不 同 角度 考量 不 同 因素 的 各 种 各 样 
改进 的 PageRank 算法 不 断 产 生 并 应 用 到 评价 实践 中 。 

同样 地 ,与 期 刊 .论文 和 作者 一 样 ,专利 文献 里 也 
存在 丰富 的 引用 关系 ,这 称 之 为 专利 引文 ,这 里 主要 采 
用 基于 审查 员 的 引用 。 在 专利 引文 中 ,根据 节点 的 不 
同 ,一 般 将 专利 引用 网 络 分 为 专利 引文 网 络 、 专 利 权 人 
引用 网 络 、 专 利 技术 领域 关联 网 络 和 专利 引用 学 术 文 
献 网 络 等 ,本文 研究 的 网 络 属于 专利 引文 网 络 , 即 
网 络 两 边 的 节点 是 专利 文献 。 网 络 中 所 有 的 节点 代表 
专利 , 边 代表 专利 之 间 的 引用 关系 。 专 利 引文 网 络 和 
网 页 链接 网 络 从 图 论 的 角度 看 均 具有 相同 的 拓扑 结 
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构 , 均 是 由 节点 和 连接 节点 的 边 组 成 ,节点 代表 个 体 ， 
边 代表 关系 ,这 两 个 网 络 在 本 质 上 是 相似 的 ,因此 ,将 
链接 网 络 中 的 PageRank 算法 应 用 到 专利 引文 网 络 中 
是 可 行 的 。 但 同时 二 者 也 有 一 些 不 同 ,首先 ,在 网 页 链 
接 关系 中 ,彼此 之 间 可 以 互相 引用 ,引用 是 相互 的 , 且 
不 考虑 时 间 的 先后 顺序 ,而 在 专利 引用 网 络 关 系 中 , 引 
有 关系 考虑 先后 顺序 ,只 能 是 后 发 表 的 专利 对 早先 发 
表 的 专利 的 引用 ,说 明了 专利 引文 网 络 对 时 序 的 要 求 ; 
其 次 ,专利 引文 网 络 是 静态 的 ,而 链接 网 络 是 动态 的 ; 
再 次 ,专利 引文 网 络 的 链接 具有 目的 性 和 集中 性 ,一 般 
专利 会 倾向 于 链接 与 当前 主题 相关 或 者 高 影响 力 的 专 
利 ,而 链接 网 络 中 的 链接 具有 随意 性 。 因 此 将 PageR- 
ank 算法 用 于 专利 引文 网 络 时 需要 做 出 相应 的 改进 。 
2.3 ”新 模型 的 构建 

正如 前 文 所 言 ,链接 网 络 和 专利 引用 网 络 之 间 存 
在 一 定 的 差别 ,其 中 最 主要 的 差别 是 专利 引用 网 络 中 
引用 的 时 间 性 和 目的 性 。 首 先 ,原始 的 PageRank 算法 
是 针对 静态 网 页 的 排序 算法 ,只 考虑 网 页 的 总 被 引 次 
数 ,不 考虑 网 页 发 表 的 时 间 , 但 是 在 专利 网 络 中 ,假如 
存在 专利 A 和 专利 B, 它 们 的 发 布 时 间 分 别 为 2005 年 
和 2010 年 ,到 目前 为 止 ,专利 A 和 专利 B 的 被 引用 次 
数 一 样 , 即 C(A) =C(B) ,但 是 很 明显 ,单位 时 间 内 专 
利 B 的 被 引用 次 数 明 显 高 于 专利 A, 专 利 B 的 影响 力 
是 高 于 专利 A 的 ,造成 这 种 现象 的 原因 是 专利 文献 的 
老化 , 即 年 代 和 久远 的 专利 并 不 会 永远 考虑 被 最 新 的 专 
利 所 引用 。 戈 斯 内 尔 (C. F.，Gosnell) 5” 曾 指出 在 知识 
的 累积 过 程 中 , 随 着 时 间 的 推移 ,一切 知识 或 其 相应 的 
载体 会 逐渐 失去 原 有 价值 ,提出 用 “文献 老化 ”表示 这 
种 文献 资料 逐渐 变 得 不 再 有 用 或 不 再 有 效 的 过 程 。 专 
利 作 为 知识 的 载体 ,也 存在 老化 情况 , 即 随 着 时 间 的 增 
长 ,年代 和 久远 的 专利 在 新 公布 专利 引文 中 的 被 引 次 数 
占 比 在 逐渐 减少 ,但 是 原始 的 PageRank 算法 不 考虑 时 
间 的 因素 ,只 考虑 总 被 引 次 数 ,这 样 使 得 最 新 发 表 的 专 
利 其 潜在 价值 就 难以 被 发 现 ,因此 引入 “时 间 性 ” 因 
子 。 其 次 ,专利 引用 并 不 是 随意 的 ,而 是 有 很 强 的 目的 
性 ,新 发 表 的 专利 一 般 会 引用 与 自己 相关 度 高 且 权 威 
性 很 高 的 基础 专利 ,在 社会 网 络 中 常常 运用 度 来 描述 
一 个 角色 的 影响 力 , 度 越 高 说 明 该 角色 越 活跃 ,也 越 显 
著 , 所 以 如 果 一 个 专利 的 入 度 很 高 ,那么 该 专利 受到 的 
认可 度 也 越 高 ,被 引用 的 概率 也 就 越 大 ,因此 ,在 专利 
引用 网 络 中 进行 值 传递 时 应 该 给 予 人 度 高 的 专利 更 大 
的 权重 ,这 里 定义 专利 的 入 度 中 心 度 即 为 专利 的 权威 
性 ,引入 “权威 性 ”因子 。 
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基于 这 两 点 ,本 文 对 传统 的 PageRank 算法 进行 了 
改进 :随机 冲浪 者 在 以 入 的 概率 按照 引用 链接 进行 跳 
转 时 不 是 以 等 概率 进行 跳 转 ,而 要 考虑 被 引 专利 的 “ 权 
威 性 "和 “时间 性 " 。 在 转移 概率 矩阵 M 部 分 ,将 节点 
“权威 性 "和 “时 间 性 ”按照 一 定 的 比例 加 权 考 虑 进来 ， 
设 比 例 性 因子 为 w。 节 点 的 “权威 性 "用 材 , 表示 ,节点 
的 “时 间 性 ”采用 文献 老化 的 负 指数 模型 ,具体 到 每 一 
个 专利 文献 , 甚 老化 模型 可 采用 贝尔 纳 的 负 指 数 模 
型 :C(t) = Cue“, 其 中 t{ 表 示 专 利 的 年 龄 , 即 统计 
年 与 发 表 年 的 差 值 ,C(t) 表示 年 龄 为 + 的 专利 在 统计 
年 的 被 引 次 数 ,C, 为 常数 ,b 为 专利 文献 的 老化 率 , 该 
部 分 用 到 表示 ,基于 此 ,本 文 建立 如 下 新 模型 ,如 公式 
(3) 所 示 : 

P=PTR(u) = (1 -A)/N + 人 > PTR(v) [a W’, 
+ 人 -oa 到 公式 (3) 
OD) 其 中 PTR(u) 和 PTR(v) 分 别 表示 专利 u 和 专利 v 
的 PitentRank 值 ,\ 是 阻尼 因子 ,一 般 取 为 0. 85,N 

是 网 络 中 节点 的 个 数 ,也 即 专利 数 。a 是 权威 性 的 比 
例 因 子 , 则 (1 -a) 是 时 间 性 的 比例 因子 。 


,= ja 是 专利 u 的 入 度 ,Max W, 是 专利 


的 出 度 的 节点 中 的 最 大 入 度数 ,W,' 是 专利 u 的 入 度 
蜂 。 


Ce h, =1 
2 0, h,=0° 
Wu) 是 专利 u 和 专利 v 的 “时 间 性 "因子 ,C 是 党 
数 8 是 老化 指数 ,7, 和 7, 分 别 是 专利 v 和 专利 u 的 发 
玫 辣 间 ,(7. -7,) 即 专利 v 和 专利 u 的 时 间 差 ,W', 是 
专利 u 和 专利 v 的 “时 间 性 ”因子 的 归 一 化 ,从 公式 可 
以 看 出 ,专利 之 间 的 时 间 差 越 大 ,其 “时 间 性 "因子 值 
越 小 ,符合 本 文 的 预 设 。 


OLED( Organic Light Emitting Diode, 有 机 发 光 二 极 
管 ) 是 一 种 新 兴 流 行 的 电子 显示 技术 ,涉及 技术 主要 有 
电 致 发 光 光 源 、 电 致 发 光 材 料 和 显示 技术 等 ,具有 很 好 
的 应 用 前 景 , 得 到 产业 界 的 广泛 关注 。 下 面 将 通过 对 
OLED 领域 的 实证 分 析 来 检验 本 文 所 提 方 法 的 科学 
性 。 
3.1 数据 来 源 与 处 理 

专利 数据 来 源 于 德 温 特 ( Derwent Innovations In- 
dex, DI) 数据库, 根据 OLED 领域 的 国际 专利 分 类 号 
以 及 关键 词 等 进行 联合 检索 ,确定 了 检索 策略 为 TI = 


i W, 
EW 


er te) = 


(“organic light emitting diode * ” or “ organic light emit- 


ting display * ”or oled or oleds or pleds or pled or “p 
led” or “organic electroluminescent” or oel or oeld) or TS 
= (“small molecular organic light emitting” or smoled or 
smoleds or “ sm oled” or “sm oleds” or “ polymer organic 
light emitting” or “ polymer light emitting diode * ” or 
“polymer light emitting display * ” ) or (IP = (HOSB - 
033 * or G09G -003 * or CO9K -011* or HOILL -051 
* or HOlL -033* or HOlL -027 x or GO9F -009 x or 
GO2F ~ O001 x or C23C -014* or CO7C -211 * or 
HOlL— 031 x or CO7F -~ 015 x or CO8G — 061 x or 
GOIR—031 * or G09G -005 * ) and TS = (“organic 
light emitting diode * ” or “organic light emitting display 
*” or oled or oleds or pleds or pled or “p led” or 
oeld) ) ,时 间 跨 度 为 1963 年 - 2016 年 (搜集 时 间 为 
2016 年 10 月 27 日) ,最 后 共 搜集 下 载 得 到 51 367 条 
专利 数据 。 

对 下 载 的 数据 进行 进一步 处 理 。 首 先 ,抽取 专利 
之 间 的 引用 关系 。 利 用 java 程序 对 专利 文档 中 的 PN 
(Patent Number) 字段 和 CP( Cited Number) 字 段 进 行 
“引用 -被 引用 关系 ”的 抽取 ,并 将 同族 专利 利用 其 
中 一 个 专利 来 代替 ,形成 一 对 一 的 专利 引用 关系 。 
其 次 ,抽取 每 个 专利 的 公开 日 期 。 本 文选 择 了 专利 
文档 中 的 GA 字段 进行 时 间 的 抽取 ,GA 字段 是 德 温 
特 主人 藏 号 , 它 是 德 温 特 分 配给 每 个 专利 族 的 第 一 
个 被 其 收录 专利 的 唯一 确认 号 ,其 前 四 位 是 年 号 ,这 
样 ,通过 GA 字段 得 到 了 每 个 专利 的 公开 时 间 ,对 于 
那些 不 在 搜集 范围 内 的 专利 ,本 文采 用 手动 检索 德 
温 特 数据 库 来 获得 其 时 间 。 在 完成 字段 的 抽取 之 
后 ,将 数据 导入 到 Pajek 软件 中 ,通过 抽取 最 大 连通 
, 共 得 到 147 694 个 专利 节点 ,对 这 些 数 据 进 行 “ 权 
威 性 ”和 “时 间 性 ”计算 之 后 ,利用 Matlab 软件 进行 
PTR 的 计算 。 
3.2 参数 a 和 C,.B 的 确定 

参数 a 是 专利 "权威 性 ”的 权重 ,本 文 利用 焙 权 
法 来 确定 该 权重 。 炉 权 法 是 一 种 客观 赋 权 法 ,不 受 
主观 因素 影响 ,在 这 里 采用 炉 权 法 对 “权威 性 ”和 “时 
间 性 ”的 权重 进行 分 配 ,通过 计算 得 到 a 为 0.9, 即 
“权威 性 ”因子 的 权重 为 0.9,“ 时 间 性 ”因子 的 权重 
为 0.1。 

前 文中 提 到 的 PTR 算法 中 的 “时 间 性 ”因子 服从 


-BT To) 二 
Coe ;shes = 


导 | 
0, h, =0 兴旺 志和 


负 指 数 模型 W (vu) -| 
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文献 的 老化 率 , 由 于 2016 年 数据 不 全 ,这 里 以 2015 年 
为 统计 年 绘制 专利 老化 曲线 ,如 图 1 所 示 , 其 中 横 坐 标 
为 专利 年 龄 , 纵 坐 标 为 在 统计 年 各 个 年 龄 阶段 专利 的 
被 引 次 数 ,并 得 到 拟 合 曲线 y = 893. 8 * e“”“, 拟 合 优 
度 RR =0.809 ,说 明 拟 合 效果 较 好 ,从 拟 合 曲线 得 知 专 
利文 献 的 老化 率 B 为 0.13,C, 为 893.8。 


被 引 次 数 


2 0007 


20 30 


专利 年 龄 
1 专利 文献 的 老化 曲线 


结果 分 析 
D1 PTR 算法 的 合理 性 ”除了 计算 专利 的 PTR 值 
外 ,本 文 还 对 专利 的 被 引 次 数 和 原始 PageRank 值 ( 简 
称 BR 值 ) 进 行 了 计算 , 表 1 列 出 了 PTR 排名 前 30 名 
专 洞 的 具体 情况 。 从 表 1 中 可 以 看 出 ,PTR 排名 前 10 
名 尝 利 中 ,PR 和 被 引 次 数 排名 也 在 前 10 名 的 专利 均 
有 念 个 , 占 80% ;在 PTR 排名 前 20 名 专利 中 ,PR 和 被 
引 沈 数 排名 也 在 前 20 名 的 专利 各 有 18 个 和 15 个 ,分 
别 占 90% 和 75% ,而 在 PTR 排名 前 30 名 专利 中 ,PR 
和 被 引 次 数 排名 也 在 前 30 名 的 专利 分 别 占 83. 3% 和 
66.7% ,从 该 统计 数据 可 以 看 出 ,PTR 算法 靠 前 的 专利 
一 般 也 是 被 引 次 数 和 PR 算法 排名 靠 前 的 专利 。 从 专 
利 权 人 看 ,这 些 专利 分 别 属于 美国 伊 斯 曼 柯达 公司 , 美 
国 普林斯顿 大 学 英国 剑桥 显示 技术 公司 ,韩国 三 星 电 
子 .日 本 新 日 铁 化 工 有 限 公司 和 日 本 先锋 电子 等 公司 ， 
其 中 柯达 公司 在 该 领域 属于 领头 羊 ,前 30 名 专利 中 有 
10 个 专利 都 属于 该 公司 , 占 到 专利 权 人 的 1/3 ,通过 查 
看 发 明 人 可 知 , 这 些 专利 的 发 明 人 是 该 公司 的 邓 青 云 
(C. W. TANG) 博士 等 一 拔 人 , 邓 青 云 也 因此 被 誉 为 
OLED 之 父 ,在 邓 青 云 博士 的 带领 下 ,柯达 公司 在 
OLED 早期 研发 过 程 中 占据 主导 地 位 ,所 以 排名 前 几 
位 专利 都 属于 柯达 公司 。 在 专利 权 人 中 ,排名 第 二 位 
的 是 美国 的 普林斯顿 大 学 ,其 发 明 的 专利 占 到 前 30 名 
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的 176, 其 代表 性 发 明 人 S，Forrest 教授 曾经 因为 在 
OLED 领域 的 贡献 获得 美国 IPO 国家 杰出 发 明 奖 和 托 
马 斯 爱迪生 奖 , 所 以 普林斯顿 大 学 的 OLED 技术 也 是 
遥遥 领先 。 除 了 OLED 小 分 子 材 料 的 研究 以 外 ,英国 
剑桥 显示 技术 公司 (CDT) 于 1990 年 公布 的 EP423283- 
A 专利 ( 表 1 中 排名 第 10 ) 首次 研发 出 了 以 共 斩 高 分 
子 PPV 为 发 光 层 的 OLED ,而 这 一 发 明 引 发 了 采用 高 
分 子 材 料 发 光 的 OLED 研究 热潮 ,因此 该 专利 在 高 分 
子 OLED 研究 方面 具有 很 强 的 开创 性 。 日 本 的 先锋 
公司 则 在 显示 屏 技术 方面 有 一 定 的 研发 优势 , 表 中 
的 JP8315981-A 专利 正 是 关于 显示 面板 的 专利 。 通 
过 上 述 分 析 , 可 以 发 现 除 个 别 特殊 情况 之 外 ,PTR 排 
名 靠 前 的 专利 其 PR 排名 和 被 引 次 数 排名 也 很 靠 前 ， 
而 且 PTR 排名 靠 前 的 专利 均 是 领域 中 比较 重要 的 专 
利 ,因此 PTR 算法 可 以 将 领域 中 一 些 关键 专利 识别 
出 来 。 

一 般 来 说 ,就 某 一 问题 所 提出 的 改进 算法 ,其 运算 
结果 不 应 该 与 已 有 算法 所 得 出 的 结果 有 太 大 的 偏差 或 
者 甚至 颠覆 原来 的 结果 ,否则 这 样 的 算法 改进 就 被 认 
为 是 不 合理 的 。 表 1 已 经 对 前 30 名 专利 进行 了 分 析 ， 
现在 通过 计算 PTR 算法 与 PR ,被 引 次 数 的 Spearman 
等 级 相关 性 来 进一步 证 明 该 算法 的 合理 性 。 本 文 涉 及 
的 专利 节点 总 共有 147 600 个 ,一 方面 节点 太 多 ,不 方 
便 把 所 有 的 节点 都 放 到 SPSS 中 进行 计算 , 另 一 方面 ， 
排名 靠 后 的 节点 其 PTR 和 PR 得 分 差距 很 小 ,对 它们 
进行 相关 性 分 析 没 有 实质 意义 。 因 此 ,这 里 截取 总 节 
点 数 的 1% 进行 研究 , 即 按照 被 引 次 数 将 节点 从 大 到 
小 降序 排列 , 取 前 1 476 个 节点 进行 分 段 分 析 ( 第 1 476 
个 节点 处 正好 是 被 引 次 数 为 20 的 节点 ) ,分 别 以 被 引 
次 数 三 100 .=60 .三 50 .三 40 三 30 和 三 20 为 分 界 点 进 
行 分 析 ,涉及 的 节点 个 数 分 别 为 37 .123 .176 ,411 .666 
和 1 476 个 ,分 析 结 果 如 表 2 所 示 。 从 表 中 可 以 看 出 ， 
在 被 引 次 数 大 于 40 次 时 ,被 引 次 数 与 PTR 的 相关 系 
数 .被 引 次 数 与 PR 的 相关 系数 均 大 于 0.5, 且 在 被 引 
次 数 大 于 100 时 ,相关 系数 最 大 , 均 在 0.7 以 上 。 同 
时 ,PTR 算法 与 被 引 次 数 的 相关 系数 在 各 个 分 段 都 优 
于 PR 算法 与 被 引 次 数 的 相关 系数 。 另 外 ,还 可 以 看 
到 原始 的 PR 算法 和 改进 后 的 PTR 算法 的 相关 系数 一 
直 很 高 ,维持 在 0.9 以 上 ,说 明 PTR 算法 与 PR 算法 在 
原理 上 有 高 度 的 一 致 性 。 

3.3.2 PTR 算法 的 优越 性 虽然 三 种 算法 在 排名 上 
大 致 趋同 ,但 是 就 各 个 专利 而 言 ,它们 之 间 的 排名 还 是 
有 一 定 的 差距 ,图 2 展示 了 PTR 算法 排名 前 30 名 专利 
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表 1 PTR 排名 前 30 名 专利 的 具体 排名 情况 


专利 号 专利 权 人 年 份 PTR 排名 PR 排名 被 引 次 数 排名 
US4356429 -A EASTMAN KODAK 1982 1 3 4 
US4539507 -A EASTMAN KODAK 1984 2 2 2 
US4769292 -A EASTMAN KODAK 1988 3 1 1 
US4720432-A EASTMAN KODAK 1988 4 5 了 
US4885211 -A EASTMAN KODAK 1988 5 4 10 
US5811833-A UNIV PRINCETON 1998 6 3 3 
US3172862-A DOW CHEMICAL CO 1965 7 15 68 
US3173050-A DOW CHEMICAL CO 1965 8 14 87 
US6030715-A UNIV PRINCETON 2000 9 9 5 
EP423283-A CAMBRIDGE DISPLAY TECHNOLOGY 1990 10 6 6 
US3710167-A RADIO CO of AMERICA 1973 11 17 88 
US5703436-A UNIV PRINCETON 1997 12 10 8 
JP8315981-A PIONEER ELECTRONIC CO 1996 13 8 17 
US6229506-B1 SARNOFF CORP 1998 14 11 15 
US5151629 -A EASTMAN KODAK 1992 15 12 11 
US20060007072 -Al1 SAMSUNG ELECTRONICS CO 2006 16 19 14 
US5061569 -A EASTMAN KODAK 1991 17 26 9 
US5294870 -A EASTMAN KODAK 1993 18 13 19 
JP10319908-A SARNOFF CO 1999 19 16 30 
US3995299-A UK SEC INDUSTRY 1976 20 42 123 
US3530325 -A AMERICAN CYANAMID 1970 21 21 105 
US5707745 -A UNIV PRINCETON 1996 22 27 13 
US4164431 -A EASTMAN KODAK 1979 23 406 127 
EP855848 -A2 INT MFG & ENG SERVICES CO LTD 1998 24 22 31 
\ US6097147-A UNIV PRINCETON 2000 25 37 12 
US3621321-A EASTMAN KODAK 1971 26 24 120 
= US4020389-A MINNESOTA MINING CO 1977 27 415 125 
WO2007063754-Al NIPPON STEEL CHEM CO 2008 28 18 18 
EP1061497-Al SONY CO 2001 29 40 25 
WO200041893-Al 3M INNOVATIVE PROPERTIES CO 2005 30 30 32 
表 2 被 引 次 数 .PR 和 PTR 之 间 的 Spearman 相关 系数 
各 分 组 被 引 次 数 三 100 被 引 次 数 大 60 | 次 数 宇 50 被 引 次 数 三 40 被 引 次 数 三 30 被 引 次 数 三 20 
被 引 次 数 与 PTR 0. 812 0.561 0. 567 0.744 0.451 0. 467 
被 引 次 数 与 PR 0.761 0.505 0.507 0.706 0.399 0.426 
PTR 与 PR 0.926 0.965 0.975 0.985 0.984 0.985 


的 三 种 算法 的 趋势 走向 情况 。 可 以 看 到 有 8 个 特殊 的 
专利 ,它们 在 三 者 排名 上 的 差异 较 大 (具体 排名 见 表 
3) ,其 中 US3172862 -A 、US3173050 -A 、US3710167 -A、 
US3995299 -A .US3530325-A 和 US3621321-A 这 6 个 专 
利 PTR 和 PR 排名 差别 很 小 ,排名 均 在 50 名 之 内 ,但 
是 被 引 次 数 排名 却 与 PTR 和 PR 排名 相差 过 大 ,排名 


均 在 50 名 之 外 。 男 外 两 个 特殊 的 专利 US4164431 -A 
和 专利 US4020389-A 的 被 引 次 数 和 原始 PR 排名 都 很 
徘 后 ,而 PTR 算法 排名 却 很 靠 前 ,从 图 中 可 以 看 到 这 
两 个 专利 的 被 引 次 数 排名 在 125 名 左右 ,PR 排名 在 
200 名 之 外 ,而 PTR 排名 却 很 靠 前 , 排 在 25 名 左右 , 差 
距 悬 丈 。 
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施 引 专利 


表 3 8 个 特殊 专利 的 施 引 专利 以 及 该 专利 的 相关 排名 情况 
被 引 次 数 排名 


被 引 专利 


一 -PTR 排名 
一 PR 排名 
-被 引 次 数 


2 排名 前 30 名 专利 的 三 种 算法 排名 变化 趋势 对 比 


发 表 时 间 


PTR 排名 


从 表 1 这 些 特殊 专利 的 专利 权 人 中 得 知 这 些 专 利 


分 办 


一 


SEC 行业 、 美 国 Cyanamid 公司 、 美 国 柯达 、 美 


属于 美国 陶 氏 化 学 公司 、 美 国 无 线 电 公司 、 英 国 


国 3M 公 


司 ,这 些 公司 都 是 90 年 代 初 发 展 起 来 的 大 公司 ,专利 
涉及 电 致 发 光电 池 ` 电 致 发 光 构 造 和 电 致 发 光 材 料 等 ， 
发 表 时 间 在 20 世纪 60 和 70 年 代 左右 。 从 表 3 中 发 现 
除了 US3172862-A .US3621321-A 和 US4020389-A 专利 
的 权利 要 求 数 在 6 个 左右 外 ,其 余 专 利 的 权利 要 求 数 


均 在 10 个 以 上 ,在 专利 外 


F 核 过 程 中 ,权利 要 求 数 不 超 


过 10 个 时 是 不 收费 的 ,但 当权 利 要 求 数 超过 10 个 时 ， 
每 条 专利 会 收取 一 定 的 附加 费 , 所 以 一 般 认 为 权利 要 
求 数 超过 10 条 的 专利 均 可 视 为 比较 重要 的 专利 ” ， 


也 就 说 这 些 特 殊 的 专利 均 是 很 


要 的 专利 。 从 这 些 专 


利 的 施 引 专 利 中 发 现 这 些 专 利 均 是 PTR 算法 中 排名 
靠 前 的 专利 ,大 部 分 排名 在 前 5 名 左右 ,说 明 这 些 发 表 


PR 排名 


权利 要 求 数 ”平均 被 引 时 间 间 隔 


a US4720432-A 
US4356429 -A 
US4769292 -A 
US4885211 -A 
US4720432 -A 


US4356429 -A 


V:202308 


sm US4539507-A 
US4769292 -A 
S US4885211-A 
5 US4720432-A 
OO US4356429 -A 
US4769292 -A 
US4885211-A 
US4356429 -A 
US4539507 -A 
US4769292 -A 
US4885211 -A 
US4356429 -A 
US4769292 -A 
US4885211 -A 
US4356429 -A 
US4356429 -A 
US4539507-A 
US4769292 -A 
US4885211-A 
WO9733296-Al 


US4356429 -A 
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在 60 -70 年 代 的 特殊 专利 为 那些 重要 专利 提供 了 技 
术 支 持 ,而 且 由 于 它们 被 高 质量 专利 所 引用 ,其 PTR 
和 PR 排名 相 比 被 引 次 数 排名 前 进 了 许多 ,这 也 解释 
了 为 什么 图 2 中 那 6 个 特殊 专利 的 被 引 次 数 排名 特别 
靠 后 而 PTR 和 PR 排名 却 很 靠 前 ,这 说 明了 PTR 算法 
相 比 被 引 次 数 的 优越 性 ,其 不 仅 可 以 识别 出 被 引 次 数 
高 的 专利 ,而 且 还 能 识别 出 被 高 质量 专利 所 引用 的 基 
础 性 专利 。 
接 下 来 说 明 PTR 算法 相 比 PR 算法 的 优越 性 ,这 
里 绘制 了 排名 前 30 名 专利 的 PTR 值 和 PR 值得 分 对 
比 图 。 从 图 3 中 可 以 看 到 ,整体 上 PTR 得 分 要 高 于 PR 
得 分 ,排名 在 前 10 名 左右 专利 的 PTR 和 PR 值 差别 较 
大 , 随 着 排名 的 推 后 ,两 条 曲线 趋 于 重合 ,看 到 二 者 在 
得 分 方面 ,PTR 算法 相 比 PR 算法 有 更 大 的 区 分 度 。 从 
图 也 中 得 知 ,专利 US4164431-A 和 专利 US4020389 -A 
的 PR 排名 比 PTR 排名 靠 后 很 多 ,查看 这 两 个 专利 的 
育 训 专利 ,发 现 均 有 专利 US84356429 -A ,该 专利 的 PR 
算 汤 排名 在 第 三 ,而 PTR 算法 排名 在 第 一 ,这 在 一 方 
会 影响 其 排名 的 变动 , 另 一 方面 ,因为 PTR 算法 相 
浪 算法 有 较 高 的 值 区 分 度 ,尤其 是 排 在 前 几 位 的 
¢ 利 ,所 以 被 PTR 排名 在 第 一 位 的 US4356429 -A 专利 
所 绚 用 的 那 两 个 特殊 专利 的 PTR 排名 相 比 PR 排名 前 
寺 沪 很 多 ,这 说 明 * 值 区 分 度 "对 引用 了 高 影响 力 专利 
的 那些 专利 有 一 定 的 影响 力 。 


1.000E-3 


二 和 
3 排名 前 30 名 专利 的 PTR 和 PR 值得 分 对 比 图 
PTR 与 PR 排名 的 差别 是 由 算法 改进 部 分 被 引 次 


数 和 专利 年 龄 引起 的 ,这 是 一 种 综合 的 结果 ,因此 只 能 
在 相对 层面 上 来 说 明 新 改进 算法 的 好 处 。 首 先 ,本 文 


计算 了 被 引 次 数 和 (PTR -PR ) 值 之 间 的 斯 皮尔 曼 相 关 
系数 ,将 被 引 次 数 按照 三 200 次 、100 -200 次 和 50 - 
100 次 三 个 分 段 进 行 划 分 ,查看 其 与 (PTR -PR ) 值 之 间 
的 关系 ,结果 显示 ,在 被 引 次 数 三 200 次 时 ,被 引 次 数 
与 (PTR -PR ) 值 之 间 的 相关 系数 为 0.682, 当 被 引 次 数 
在 100 -200 次 之 间 时 ,相关 系数 为 0.521 , 当 被 引 次 数 
在 50 -100 次 之 间 时 ,相关 系数 为 0.272, 说 明 “ 权 威 
性 ”因子 对 PTR 值 的 影响 会 随 着 被 引 次 数 的 增 大 而 增 
大 ,从 表 1 中 可 以 看 到 ,相同 年 份 下 ,被 引 次 数 排名 靠 
前 的 专利 其 PTR 排名 也 相对 靠 前 ,例如 发 表 于 1988 年 
的 三 个 专利 PTR 排名 大 小 顺序 基本 与 被 引 次 数 相同 。 
其 次 ,这 里 专利 年 龄 用 专利 的 平均 被 引 时 间 间 隔 来 表 
示 ,平均 被 引 时 间 间 隔 指 一 件 专利 从 发 明 到 被 其 他 专 
利 所 引用 的 所 有 时 间 的 平均 ,本 文 探究 了 专利 平均 被 
引 时 间 间 隔 与 (PITR-PR) 值 之 间 的 关系 。 结 果 发 现 除 
个 别 特殊 点 之 外 ,平均 被 引 时 间 间 隔 对 (PTR -PR ) 值 的 
影响 几乎 为 0, 即 使 有 一 些 影响 ,也 是 在 局 部 有 微小 的 
变动 ,例如 在 平均 被 引 时 间 间 隔 位 于 5 -20 年 之 间 的 
专利 ,其 (PTR-PR) 值 有 些 变动 ,说 明了 “时 间 性 ”因子 
对 PTR 算法 整体 得 分 影响 较 小 ,从 表 3 列 出 的 这 些 专 
利 的 平均 被 引 时 间 间 隔 可 以 看 出 ,排名 在 前 面 的 专利 
的 被 引 次 数 也 排 在 前 面 ,但 是 平均 被 引 时 间 间 隔 却 不 
是 很 小 ,而 对 于 被 引 次 数 排名 差不多 的 专利 ,平均 被 引 
时 间 间 隔 小 的 专利 排名 就 稍微 有 点 优势 ,例如 表 3 中 
的 US3995299 -A 专利 相 比 专利 US3621321 -A 来 说 ,被 
引 次 数 排名 不 如 US3621321 -A ,但 是 平均 被 引 时 间 间 
隔 比 US3621321-A 小 ,所 以 PTR 排名 靠 前 ,US4164431- 
A 和 US4020389 -A 专利 相 比 也 是 如 此 。 因 此 ,在 针对 
专利 引用 网 络 进行 研究 时 ,专利 的 年 龄 对 PTR 的 影响 
要 远 远 小 于 被 引 次 数 ,改进 后 的 PTR 在 局 部 改善 了 PR 
的 排名 。 


4 结论 


本 文 首 先 界定 了 核心 专利 是 “高 影响 力 "专利 的 
概念 ,然后 总 结 了 现 有 识别 核心 专利 的 方法 ,并 抓 住 运 
用 改进 PageRank 算法 进行 核心 专利 识别 研究 的 空白 
领域 进行 研究 。 通 过 介绍 原始 PageRank 算法 的 基本 
原理 ,并 结合 专利 的 两 个 属性 “权威 性 ” 因子 和 “时 间 
性 ”因子 ,对 PageRank 算法 进行 了 改进 ,提出 了 改进 后 
的 PTR 算法 ,也 就 是 加 权 PageRank 算法 ,并 将 其 应 用 
到 OLED 领域 进行 了 实证 分 析 , 通 过 数据 分 析 , 可 以 得 
到 以 下 几 个 结论 : 

(1) 改 进 后 的 PTR 算法 不 仅 考虑 了 引用 链接 的 次 
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数 ,还 将 专利 的 年 龄 和 专利 的 被 引 次 数 考虑 到 了 Pag- 
eRank 算法 中 ,PageRank 算法 本 身 和 这 些 新 增 的 加 权 
条 件 均 属于 围绕 专利 的 客观 因素 ,因而 主观 性 很 弱 , 这 
使 得 评价 结果 更 加 科学 。 

(2) 改 进 的 PTR 算法 同 被 引 次 数 .原始 PageRank 

算法 一 样 ,能 够 识别 出 OLED 领域 的 一 些 关 键 性 专利 。 
PTR 算法 .PR 算法 和 被 引 次 数 之 间 的 Spearman 相关 
系数 验证 了 被 引 次 数 与 PR 和 PTR 之 间 PR 与 PTR 之 
间 有 较 强 的 相关 性 ,说 明了 改进 后 的 PTR 算法 在 识别 
核心 专利 方面 与 PR 算法 和 被 引 次 数 的 高 度 一 致 性 ， 
而 且 PTR 算法 排名 前 30 名 的 专利 基本 上 都 是 领域 内 
比较 重要 的 专利 ,说 明 用 PTR 算法 来 发 现 领域 内 的 核 
心 专利 具有 一 定 的 合理 性 。 
这 (3) 改 进 后 的 PTR 算法 不 仅 能 识别 出 被 引 次 数 高 
的 楼 心 专利 ,而 且 还 能 识别 出 被 引 次 数 低 的 基础 性 专 
和 体现 了 PTR 算法 相 较 被 引 次 数 的 优越 性 。 前 文中 
担 到 的 8 个 特殊 的 专利 ,其 被 引 次 数 虽然 较 低 ,但 是 均 
受到 高 质量 专利 的 认可 ,从 而 得 到 了 较 高 的 PTR 值 ， 
发 珊 这 些 基础 性 专利 为 研究 该 领域 提供 了 追 本 溯源 的 
研 颖 思路 ,这 也 是 PTR 算法 的 优越 性 之 一 。 
CN(4) 改 进 后 的 PTR 算法 结果 和 PR 算法 结果 高 度 
晓 会 却 又 有 所 区 别 ,PTR 算法 相 较 PR 算法 具有 更 高 的 
区 分 度 。PTR 算法 和 PR 算法 的 相关 系数 在 0.9 以 上 ， 
说 天 二 者 在 原理 上 的 一 致 性 ,但 是 ,从 PTR 排名 前 30 
各 全 利 的 二 者 得 分 册 线 图 又 可 以 看 到 二 者 在 表现 好 的 
专 昱 之 间 ,PTR 曲线 要 比 PR 曲线 陡峭 ,其 得 分 差距 明 
显 5 末 明了 PTR 算法 相 较 PR 算法 可 以 将 质量 好 的 专 
利 铠 显 出 来 ,区 分 度 较 高 。 

(5) 改进 后 的 PTR 算法 排名 结果 在 局 部 调整 了 
PR 的 排名 , 且 PTR 受到 被 引 次 数 的 影响 要 大 于 专利 的 
年 龄 对 PTR 的 影响 ,说 明了 在 专利 引用 网 络 中 ,时 间 
属性 对 网 络 中 节点 的 影响 较 小 ,在 之 后 的 研究 中 可 以 
忽略 时 间 对 专利 引用 网 络 的 影响 。 

同时 ,本 文 在 研究 过 程 中 也 存在 一 些 不 足 ,首先 ， 
在 进行 OLED 领域 分 析 时 ,没有 对 其 进行 行业 细 分 ;其 
次 ,在 OLED 领域 中 ,没有 固定 的 “ 金 标准 "可 以 将 被 引 
次 数 和 PR .PTR 排名 进行 比较 ,在 接 下 来 的 研究 中 ,会 
选择 相对 比较 成 熟 的 具有 公认 的 核心 技术 的 领域 进行 
研究 ,以 便 更 科学 地 探究 所 要 研究 的 方法 。 
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Research on the Discovery of Core Patents Based on Improved PageRank Algorithm 
Zhang Xin'” Ma Ruimin’ 
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“School of Ecnomics and Management, University of Chinese Academy of Sciences, Beijing 100190 
、 ? College of Economic and Management, Shanxi university, Taiyuan 030006 
( SUAbstract: [ Purpose/significance ] The discovery of core patents is an important part in technological innovation, 
which, js of great significance to the technological improvement and the patent strategy layout. | Method/process | This 


paper firstly defined the concept of core patent. Then, by introducing the original PageRank algorithm model, the im- 


pzoxed PageRank PatentRank (referred to as PTR) was put forward, which combining the cited times of patents and 
We Datent age. Finally, we applied the new model to the field of OLED to identify the core patents. [ Result/conclusion | 
Wecfind that compared with the cited times, PTR can not only identify the core patents but also some basic important pa- 
tentsswhich provide the research ideas for the research of OLED technology. Besides, compared with the original PageRank 
algoBithm, the values of PTR have higher degree of differentiation, and it can improve the PR results on the local scale. 


Keywords: PageRank core patents OLED 
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